强化学习

  • model-free
    • 不知道环境,等待现实世界反馈
    • 按部就班

  • 理解环境 model base
    • 知道环境
    • 可以理解为加了预知道条件
    • 可以想像
      • RLmtd1.png
  • Qlearning
  • 2-1-1.png (578×218) - image.png